04|深入浅出索引(上)

2019-11-22 mysql-notes Notes Comments

索引类似于书本的目录，能够提高数据查询效率。

所以有序数组适合静态存储引擎，如2017年某个城市的所有人口信息。

左子节点小于父节点，父节点小于右子节点。

查询复杂度：O(log(n))
更新时间复杂度：O(log(n))

（1）二叉树虽然效率高，但是每一层存储的数据量比较少。假如在特别大的数据量的情况下，使用二叉树会导致树的层数非常高。层数越多，访问磁盘的次数越多，磁盘读取往往是性能的瓶颈，所以二叉树的读取性能就回很差。

（2）为了尽量的少读磁盘，让查询过程访问尽量少的数据块，应该使用多叉树。假如一个N=1200的多叉树，树高为4，可以存储1200的三次方的数据(17亿)。也就是在这17亿的数据中，查找一条记录，最多访问磁盘三次。

InnoDB的索引模型：B+树索引模型,每一个索引在InnoDB中就对应一棵B+树

叶子节点存储整行数据

叶子节点存储的是主键的值

普通索引会多扫描一次索引，应该优先使用主键索引

B+树维护了索引的有效性，当插入新值的时候，就要做必要的维护

当插入数据所在页的数据页满了，就要重新申请一个新的数据页，让后再挪动部分数据过去。性能受影响。

相邻两个数据页因为删除了数据，利用率很低之后，会将数据页进行合并。

索引的维护过程中，会出现页分裂和页合并的现象，这些是比较耗费性能的。所以现在的建表规范里面都要求使用自增字段。那自增字段能够对索引维护起到什么作用吗？

自增逐渐的插入数据模式都是追加操作，不会涉及挪动其他记录，不会触发叶子节点的分裂。—-性能
如果使用业务字段做主键，不容易保证有序插入，写数据成本高。—-性能
自增逐渐相比业务字段作逐渐节省存储空间。如果使用身份证之类的作为主键，那么普通索引的叶子节点(主键)就会占用比较多的存储空间(字符串20个字节)，整型(4个字节)，长整型(8个字节)。—-存储空间

主键长度约小，普通索引的叶子节点就越小，普通索引占用的空间就越小

业务字段作为主键的场景：

本文链接： https://shawnyou.tech/2019/11/22/mysql-notes/04|深入浅出索引(上)/

版权声明： 本博客所有文章除特别声明外，均采用 CC BY 4.0 CN协议许可协议。转载请注明出处！

个人简介。